检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于深度神经网络的视频播放速度识别

陈荣源, 姚剑敏, 严群, 林志贤

《计算机应用》唯一官方网站 2022, 42 (7): 2043-2051. DOI: 10.11772/j.issn.1001-9081.2021050799

摘要（394）

HTML （18）

PDF （2746KB）（184）

针对目前的视频播放速度识别算法大多存在的提取精度差、模型参数量巨大的问题，提出了一种双支轻量化视频播放速度识别网络。首先，该网络是基于SlowFast双支网络架构组建的一个三维（3D）卷积网络；其次，为了弥补S3D-G网络在视频播放速度识别任务中存在的参数量大、浮点运算数多的缺陷，进行了轻量化的网络结构调整；最后，在网络结构中引入了高效通道注意力（ECA）模块，以通过通道注意力模块生成重点关注的内容对应的通道范围，这有助于提高视频特征提取的准确性。在Kinetics-400数据集上将所提网络与S3D-G、SlowFast网络进行对比实验。实验结果表明，所提网络在精确度差不多的情况下，模型大小和模型参数均比SlowFast减少了大约96%，浮点运算数减少到5.36 GFLOPs，显著提高了运行速度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度神经网络的移动端人像分割

杨坚伟, 严群, 姚剑敏, 林志贤

计算机应用 2020, 40 (12): 3644-3650. DOI: 10.11772/j.issn.1001-9081.2020050699

摘要（467）

PDF （1778KB）（831）

针对现有的人像分割算法大多忽略移动设备的硬件限制，盲目追求效果，以致无法满足移动端对于分割速度要求的问题，提出了一种可在移动设备上高效运行的人像分割网络。首先，基于编码器-解码器的轻量级U型架构来构建网络；其次，为了克服全卷积网络（FCN）受制于较小的感受域，无法充分捕获长距离信息的缺陷，引入期望最大化注意力块（EMAU）置于编码器之后、解码器之前；然后，在训练阶段添加多层边界辅助损失，有助于提高人物边界轮廓的准确度；最后，对模型进行量化和压缩。在Veer数据集上将所提网络与PortraitFCN+、ENet和BiSeNet等网络进行对比实验。实验结果表明，所提网络可以提高图像推理速度和分割效果，并能够以95.57%的准确率处理分辨率为224×224的RGB图像。

参考文献 | 相关文章 | 多维度评价